پایگاه دادهها (به طور خلاصه پایگاه)، بانک اطلاعاتی، دادِگان[۱] و یا دیتابیس (به انگلیسی: Database) به مجموعهای از دادهها با ساختار منظم و سامانمند گفته میشود.
تعریف
پایگاه دادهها (دادگان یا بانک اطّلاعاتی) به مجموعهای از اطّلاعات با ساختار منظم و سامانمند گفته میشود. پایگاههای دادهها معمولاً در قالبی که برای دستگاهها و رایانهها قابل خواندن و دسترسی باشد ذخیره میشوند. البته چنین شیوه ذخیرهسازی اطلاعات تنها روش موجود نیست و شیوههای دیگری مانند ذخیرهسازی ساده در پروندهها نیز استفاده میگردد. آنچه ذخیرهسازی دادهها در پایگاههای دادهها را مؤثر میسازد وجود یک ساختار مفهومی برای ذخیرهسازی و روابط بین دادهها است.
پایگاه داده در اصل مجموعهای سازمان یافته از اطلاعات است. این واژه از دانش رایانه سرچشمه میگیرد، اما کاربرد وسیع و عمومی نیز دارد، این وسعت به اندازهای است که مرکز اروپایی پایگاه داده (که تعاریف خردمندانهای برای پایگاه داده ایجاد میکند) شامل تعاریف غیر الکترونیکی برای پایگاه داده میباشد. در این نوشتار به کاربردهای تکنیکی برای این اصطلاح محدود میشود.
یک تعریف ممکن این است که: پایگاه داده مجموعهای از رکوردهای ذخیره شده در رایانه با یک روش سیستماتیک (اصولی) مثل یک برنامه رایانهای است که میتواند به سؤالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولاً به صورت مجموعهای از اجزای دادهای یا رویدادها سازماندهی میگردد. بخشهای بازیابی شده در هر پرسش به اطلاعاتی تبدیل میشود که برای اتخاذ یک تصمیم کاربرد دارد. برنامه رایانهای که برای مدیریت و پرسش و پاسخ بین پایگاههای دادهای استفاده میشود را مدیر سیستم پایگاه دادهای یا بهاختصار (DBMS) مینامیم. خصوصیات و طراحی سیستمهای پایگاه دادهای در علم اطلاعات مطالعه میشود.
مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعهای از رکوردها یا تکههایی از یک شناخت است. نوعاً در یک پایگاه داده توصیف ساخت یافتهای برای موجودیتهای نگه داری شده در پایگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته میشود. مدل توصیفی، اشیا پایگاههای داده و ارتباط بین آنها را نشان میدهد. روشهای متفاوتی برای سازماندهی این مدلها وجود دارد که به آنها مدلهای پایگاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده میشود، مدل رابطهای است که به طور عام به صورت زیر تعریف میشود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطرها و ستونها تشکیل شدهاست (تعریف حقیقی آن در علم ریاضیات برسی میشود). در این مدل وابستگیها به کمک مقادیر مشترک در بیش از یک جدول نشان داده میشود. مدلهای دیگری مثل مدل سلسله مراتب و مدل شبکهای به طور صریح تری ارتباطها را نشان میدهند.
در مباحث تخصصیتر اصطلاح پایگاه داده به صورت مجموعهای از رکوردهای مرتبط با هم تعریف میشود. بسیاری از حرفهایها مجموعهای از دادههایی با خصوصیات یکسان به منظور ایجاد یک پایگاه دادهای یکتا استفاده میکنند.
معمولاً DBMSها بر اساس مدلهایی که استفاده میکنند تقسیم بندی میشوند: ارتباطی، شیء گرا، شبکهای و امثال آن. مدلهای دادهای به تعیین زبانهای دسترسی به پایگاههای داده علاقهمند هستند. بخش قابل توجهی از مهندسی DBMS مستقل از مدلهای میباشد و به فاکتورهایی همچون اجرا، همزمانی، جامعیت و بازیافت از خطاهای سختافزاری وابستهاست. در این سطح تفاوتهای بسیاری بین محصولات وجود دارد.
تاریخچه پایگاه داده
مفهوم پایگاه داده
مفهوم پایگاه داده از دههٔ ۱۹۶۰ برای کاهش مشکلات فزاینده در طراحی، ساخت، و نگهداشت سسیستمهای اطلاعاتی (معمولاً با تعداد زیادی کاربرِ نهایی همزمان، و با تعداد زیادی دادهٔ مختلف) ایجاد شدهاست. این مفهوم به همراه مفهوم سیستمهای مدیریت پایگاه داده که دستکاری مؤثر و کارا به پایگاه دادهها را ممکن میکند رشد کردهاست.
اولین کاربردهای اصطلاح پایگاه داده به ژوئن ۱۹۶۳ باز میگردد، یعنی زمانی که شرکت System Development Corporation مسئولیت اجرایی یک طرح به نام «توسعه و مدیریت محاسباتی یک پایگاه دادهای مرکزی» را بر عهده گرفت. پایگاه داده به عنوان یک واژه واحد در اوایل دهه ۷۰ در اروپا و در اواخر دهه ۷۰ در خبر نامههای معتبر آمریکایی به کار رفت.(بانک دادهای یا در اوایل سال ۱۹۶۶ در روزنامه واشینگتن پست کار رفت)
اولین سیستم مدیریت پایگاه داده در دهه ۶۰ گسترش یافت. از پیشگامان این شاخه چارلز بکمن میباشد. مقالات بکمن این را نشان داد که فرضیات او کاربرد بسیار مؤثرتری برای دسترسی به وسایل ذخیرهسازی را مهیا میکند. در آن زمانها پردازش داده بر پایه کارتهای منگنه و نوارهای مغناطیسی بود که پردازش سری اطلاعات را مهیا میکند. دو نوع مدل دادهای در آن زمانها ایجاد شد:IBM محصولIMS را تولید نمود.
مدل رابطهای توسط E. F. Codd در سال ۱۹۷۰ ارائه شد. او مدلهای موجود را مورد انتقاد قرار میداد. برای مدتی نسبتاً طولانی این مدل در مجامع علمی مورد تأیید بود. اولین محصول موفق برای میکرو کامپیوترها dBASE بودکه برای سیستمعاملهایCP/M و PC-DOS/MS-DOS ساخته شد. در جریان سال ۱۹۸۰ پژوهش بر روی پایگاههای مدل توزیع شده و ماشینهای پایگاهی (database machines) متمرکز شد، اما تأثیر کمی بر بازار گذاشت. در سال ۱۹۹۰ توجهات به طرف مدل شیء گرا جلب شد. این مدل جهت کنترل دادههای مرکب لازم بود و بهسادگی بر روی پایگاه دادههای خاص، مهندسی داده (شامل مهندسی نرمافزار منابع) و دادههای چند رسانهای کار میکرد.
در سال ۲۰۰۰ نوآوری تازهای رخ داد و پایگاه اکسامال (XML) به وجود آمد. هدف این مدل از بین بردن تفاوت بین مستندات و دادهها است و کمک میکند که منابع اطلاعاتی چه ساخت یافته باشند یا نه در کنار هم قرار گیرند.
مدلهای پایگاه داده
الگوی کاری کاربران پایگاه دادهها را در سطح منطقی مشخص میکند. شگردهای مختلفی برای مدلهای دادهای وجود دارد. برای هر یک از مدلهای منطقی اجراهای فیزیکی مختلفی قابل پیادهسازی است و سطوح کنترل مختلفی در انطباق فیزیکی برای کاربران مهیا میکند. این مدلها عبارتند از مدل تخت، مدل سلسله مراتبی، مدل شبکهای و مدل رابطهای. مدل رابطهای اساس کار سامانه مدیریت پایگاه دادههای امروزی است.
سامانهٔ مدیریت پایگاه دادهها DBMS
مقاله اصلی: سامانه مدیریت پایگاه دادهها یک نرمافزار رایانهای است که با هدف مدیریت پایگاه دادهها طراحی شدهاست به گونهای که کاربر درگیر مسائل مربوط به ذخیره و بازیابی و شاخص بندی دادهها نمیشود و بر روی طراحی منطقی پایگاه تمرکز مینماید.